Loading...
机构名称:
¥ 3.0

摘要:近年来,人工智能 (AI) 安全在各种安全关键和道德问题的影响下获得了国际认可,这些问题有可能掩盖 AI 的广泛有益影响。在此背景下,AI 观测站工作的实施代表了一个关键的研究方向。本文提出了一种跨学科的 AI 观测站方法,将各种回顾性和反事实观点融为一体。我们利用具体的实际例子提供实用建议,同时阐明目标和局限性。区分无意和有意触发的具有不同社会心理技术影响的 AI 风险,我们举例说明了回顾性描述性分析,然后是回顾性反事实风险分析。基于这些 AI 观测站工具,我们提出了近期的跨学科 AI 安全指南。作为进一步的贡献,我们通过两个不同的现代人工智能安全范式的视角讨论了差异化和量身定制的长期方向。为简单起见,我们分别用术语人工智能愚蠢(AS)和永恒创造力(EC)来指代这两个不同的范式。虽然 AS 和 EC 都承认需要采用混合认知情感方法来确保人工智能安全,并且在许多短期考虑方面存在重叠,但它们在多个设想的长期解决方案模式的性质上存在根本区别。通过汇编相关的潜在矛盾,我们旨在为实践和理论人工智能安全研究中的建设性辩证法提供面向未来的激励。

ThinkIR 引用 Aliman, Nadisha Marie;Kester, Leon;Yampolskiy, Roman,“跨学科人工智能观察站——回顾性分析和面向未来的对比”(2021 年)。教师奖学金。553。https://ir.library.louisville.edu/faculty/553

ThinkIR 引用 Aliman, Nadisha Marie;Kester, Leon;Yampolskiy, Roman,“跨学科人工智能观察站——回顾性分析和面向未来的对比”(2021 年)。教师奖学金。553。https://ir.library.louisville.edu/faculty/553PDF文件第1页

ThinkIR 引用 Aliman, Nadisha Marie;Kester, Leon;Yampolskiy, Roman,“跨学科人工智能观察站——回顾性分析和面向未来的对比”(2021 年)。教师奖学金。553。https://ir.library.louisville.edu/faculty/553PDF文件第2页

ThinkIR 引用 Aliman, Nadisha Marie;Kester, Leon;Yampolskiy, Roman,“跨学科人工智能观察站——回顾性分析和面向未来的对比”(2021 年)。教师奖学金。553。https://ir.library.louisville.edu/faculty/553PDF文件第3页

ThinkIR 引用 Aliman, Nadisha Marie;Kester, Leon;Yampolskiy, Roman,“跨学科人工智能观察站——回顾性分析和面向未来的对比”(2021 年)。教师奖学金。553。https://ir.library.louisville.edu/faculty/553PDF文件第4页

ThinkIR 引用 Aliman, Nadisha Marie;Kester, Leon;Yampolskiy, Roman,“跨学科人工智能观察站——回顾性分析和面向未来的对比”(2021 年)。教师奖学金。553。https://ir.library.louisville.edu/faculty/553PDF文件第5页

相关文件推荐